Rapid Miner
نویسنده
چکیده
Data Mining, also die Entdeckung verborgener Zusammenhänge mittels Methoden des statistischen und des maschinellen Lernens, wird gemeinhin als ein Feld für Spezialisten betrachtet. Diese erstellen mit häufig sündhaft teuren Softwarelösungen mehr oder weniger komplexe Analyseprozesse, um beispielsweise drohende Kündigungen oder die Verkaufszahlen eines Produkts zu prognostizieren. Der wirtschaftliche Nutzen liegt auf der Hand, und so galt lange Zeit, dass die Anwendung von Data Mining Tools auch mit hohen Kosten für Softwarelizenzen und den auf Grund der Komplexität der Materie oft notwendigen Support verbunden war. Dass Softwarelösungen für Data Mining jedoch nicht zwingend teuer oder schwer zu bedienen sein müssen, daran dürfte spätestens seit der Entwicklung der Open Source Software RapidMiner wohl niemand mehr ernsthaft zweifeln. Begonnen wurde die Entwicklung von RapidMiner unter dem Namen „Yet Another Learning Environment“ (YALE) am Lehrstuhl für künstliche Intelligenz der Universität Dortmund unter der Leitung von Prof. Dr. Katharina Morik. Mit der Zeit wurde die Software immer ausgereifter, beinahe eine halbe Million Downloads wurden seit dem Entwicklungsstart im Jahre 2001 verzeichnet. Unter den vielen Tausend Anwendern waren auch viele Unternehmen, welche nach einem Partner mit entsprechender Data Mining Kompetenz für Dienstleistungen und Projekte suchten. Diesem Bedarf folgend, wurde von den RapidMiner-Entwicklern das Unternehmen Rapid-I gegründet, welches heute auch für die Weiterentwicklung und Wartung der Software verantwortlich ist. Im Zuge der Unternehmensgründung wurde die Software YALE ihrer neuen Bedeutung entsprechend in RapidMiner umbenannt. Damit befinden sich RapidMiner und das dahinter stehende Unternehmen Rapid-I auf einem guten Wege: Rapid-I erreichte den vierten Platz beim nationalen Start-Up Wettbewerb „start2grow“ und gewann bei Europas höchstdotiertem IT-Wettbewerb „Open Source Business Award“ den ersten Preis. RapidMiner selbst wurde auf dem bekannten Data Mining Portal „KDnuggets“ zwei Mal in Folge zur meistverwendeten Open Source Data Mining Lösung gewählt – und auch insgesamt machte RapidMiner mit einem knappen zweiten Platz unter den mehr als 30 auch proprietären Lösungen eine mehr als gute Figur.
منابع مشابه
O-miner: an integrative platform for automated analysis and mining of -omics data
High-throughput profiling has generated massive amounts of data across basic, clinical and translational research fields. However, open source comprehensive web tools for analysing data obtained from different platforms and technologies are still lacking. To fill this gap and the unmet computational needs of ongoing research projects, we developed O-miner, a rapid, comprehensive, efficient web ...
متن کاملCI-Miner: Scientific Workflows in Support of Cyber-Infrastructure Functionalities
Initial cyberinfrastructure (CI) efforts have primarily focused on gathering and recording scientific information from distributed, cross-disciplinary domains and developing customized applications to access such information. CI-Miner is a framework for enhancing an existing CI with knowledge that can be used to develop scientific applications that knows how to use the resources available over ...
متن کاملFUZZY GRAVITATIONAL SEARCH ALGORITHM AN APPROACH FOR DATA MINING
The concept of intelligently controlling the search process of gravitational search algorithm (GSA) is introduced to develop a novel data mining technique. The proposed method is called fuzzy GSA miner (FGSA-miner). At first a fuzzy controller is designed for adaptively controlling the gravitational coefficient and the number of effective objects, as two important parameters which play major ro...
متن کاملA Study on Ant Colony Optimization with Association Rule
Ant miner is a data mining algorithm based on Ant Colony Optimization (ACO). Ant miner algorithms are mainly for discovery rule for optimization. Ant miner + algorithm uses MAX-MIN ant system for discover rules in the database. Soil classification deals with the systematic categorization of soils based on distinguished characteristics as well as criteria. The proposed model delivers to Ant mine...
متن کاملData Mining Using Learning Automata
In this paper a data miner based on the learning automata is proposed and is called LA-miner. The LA-miner extracts classification rules from data sets automatically. The proposed algorithm is established based on the function optimization using learning automata. The experimental results on three benchmarks indicate that the performance of the proposed LA-miner is comparable with (sometimes be...
متن کاملcAnt-Miner: An Ant Colony Classification Algorithm to Cope with Continuous Attributes
This paper presents an extension to Ant-Miner, named cAntMiner (Ant-Miner coping with continuous attributes), which incorporates an entropy-based discretization method in order to cope with continuous attributes during the rule construction process. By having the ability to create discrete intervals for continuous attributes “on-the-fly”, cAnt-Miner does not requires a discretization method in ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- KI
دوره 23 شماره
صفحات -
تاریخ انتشار 2009